SEMAINE DU 10 JUIN 2024 au 14 JUIN 2024 :

OBJECTIF : Analyser la base de données

ANALYSE DE LA BASE DE DONNÉES

I ) Import de la nouvelle base de données formattée

# Import des données

data <- readRDS("/home/solene_petito/Bureau/Stage/Broken_devices/data/data.rds") # base de données sur laquelle on va appliquer tous les changements

Broken_Devices_Data <- read.csv("/home/solene_petito/Bureau/Stage/Broken_devices/data/Broken-Devices-Data1-xlsx.csv",row.names=1) # base de données initiale sur laquelle on pourra se référer pour voir si les chgts ont bien été appliqués

# nombre d'observations
nb_obs <- nrow(data) # 1005 

# nombre de variables 
nb_var <- ncol(data) # 164

II ) Quantification des personnes non éligibles

Les personnes non éligibles sont celles qui n’ont pas indiqué si elles ont recontré un problème avec leur smartphone, dans la base de données, on les repère par le fait qu’elles n’ont pas indiqué un numéro de pb dans la colonne “RIDENTIFICATION_PROBLEMES”, et que leur reponse apprait comme une chaine de caractères vide (““). N’ayant pas indiqué de raisons de dysfonctionnement, le reste des réponses qui suit dans la base est vide, ce qui parait logique. En tout, les personnes en question auront répondu à moins de 50% des questions du questionnaire, il est donc préférable de les enlever de la base pour la suite de l’analyse. Les autres personnes ayant répondu à 50% des questions sont celles ayant indiqué la raison 27 dans la colonne”RIDENTIFICATION_PROBLÈMES”, mais il est nécessaire de les garder pour les futurs analyses à des fins de comparaisons entre individus.

# Nombre total d'individus dans la base
nb_individus=nrow(data)

# Sélection des individus non éligibles
individus_non_eligibles = data[which(data$RIDENTIFICATION_PROBLEMES == ""),]

# Nombre d'individus non éligibles
n=nrow(individus_non_eligibles)
print(n) # 37
## [1] 37
# Part de personnes non éligibles : celles qui n'ont pas renseigné de pbs dans identification pbs 

res <- 100*n/nb_individus
print(round(res,1)) # 3.7 %
## [1] 3.7
# Repérer parmis ces individus ceux qui ont répondu à moins de 50% des réponses

# Variables qui sont entièrement composées de valeurs manquantes parmis les individus non éligibles 
colsums_na<-sapply(individus_non_eligibles, function(x) sum(is.na(x)))
na_count=n 
column_names <- names(individus_non_eligibles)[which(colsums_na == na_count)] # Quelles colonnes ont 37 valeurs manquantes ?

# individus_non_eligibles[,column_names]<-list(NULL)

# Nombre de colonnes concernées : 136 (sur 165 ce qui est beaucoup)
 length(column_names)
## [1] 136
# Décommentez la ligne qui suit pour obtenir tous les noms de colonnes concernées
# column_names 

On les supprime donc de la base :

data <- data[data$RIDENTIFICATION_PROBLEMES != "", ]
nb_individus=nrow(data)
View(data)

On a désormais 938 individus dans notre base de données.

III ) Combien de personnes n’ont pas rencontré de problèmes avec leur smarthphone ?

En tout, c’est 59% de personnes dans la base qui ont indiqué, qu’il ne rencontrait pas de problèmes avec leur smartphone :

## [1] 58.7

IV ) Statistiques descriptives basiques

Une partie des statistiques descriptives de base a déjà été réalisée grâce au summary réalisé précédemment.

A ) Variable “SEXE”

Rappel : Libellé modalité

  • 1 : Homme

  • 2 : Femme

## [1] "Pourcentage de femmes dans la base : 54 %"
## [1] "Pourcentage d'hommes dans la base : 46 %"

Dans la base de données, il y a donc 446 hommes et 522 femmes.

B ) Répartition des âges

1 ) Variable “AGE”

On remarque que les personnes autour de 65 ans sont majoritaires dans la base de données et que les personnes autour de la vingtaine le sont aussi. Les âges vont de 15 à 80 ans.

2 ) Variable “TAG5” (par Tranche d’âges)

Rappel : Libellé modalité (Variable “Tag5”)

  • 1 : 15-24 ans

  • 2 : 25-34 ans

  • 3 : 35-49 ans

  • 4 : 50-64 ans

  • 5 : 65-80 ans

On remarque que les catégories majoritaires sont les 35-49 ans et les 50-64 ans, comme ce que nous avait indiqué l’histogramme ci-dessous.

C ) Variable “CSP9”

Rappel : Libellé modalités (Variable “CSP9”)

  • 1 : Agriculteurs

  • 2 : Artisans

  • 3 : Cadres

  • 4 : Professions Intermédiaires

  • 5 : Employés

  • 6 : Ouvriers

  • 7 : Retraités

  • 8 : Etudiants

  • 9 : Autres Inactifs

On a 3 catégories qui ressortent plus que d’autre, il s’agit de la 7 (Retraités), de la 5 (Employés) et de la 3 (Cadres), avec les femmes qui sont majoritaires pour les catégories 7 et 5, et les hommes qui le sont pour la catégorie 3. Les agriculteurs (catégorie 1) eux sont trés peu représentés (5 personnes dans toutes la base).

V ) Type de casse

1 ) Répartition des différents types de casse

as.numeric(df$categorie)
##  [1]  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
## [26] 26

Les dysfonctionnements 10 (problème de batterie), 18 (stockage saturé) et 25 (problème de lenteur) sont ceux qui reviennent le plus chez les propriétaires des smartphones, avec 114 personnes pour le 10, 93 personnes pour le 18, et 83 personnes pour le 25.

2 ) Incidence du genre du propriétaire sur les dysfonctionnements

Chez les hommes, c’est 43% des personnes qui rencontres un dysfonctionnment sur leur smartphone et donc 57% qui n’ne rencontrent pas. Les problèmes qui reviennet le plus sont le 10 (problème de batterie) avec 49 personnes, le 25 (problème de lenteur) avec 46 personnes et le 18 (stockage saturé) avec 31 personnes. Comme nous le montre la matrice suivante, qui indique en ligne 1, le numéro du problème et en ligne 2, le nombre d’hommes le rencontrant :

##      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14]
## [1,]    1    2    3    4    5    6    7    8    9    10    11    12    13    14
## [2,]   20   18   10    2    3   11   14    9   20    49    22     4     7    10
##      [,15] [,16] [,17] [,18] [,19] [,20] [,21] [,22] [,23] [,24] [,25] [,26]
## [1,]    15    16    17    18    19    20    21    22    23    24    25    26
## [2,]    11     7     3    31    11    16    15     7    12    23    46     2
##      [,27]
## [1,]    27
## [2,]   254
## [1] 43.05

Chez les femmes, c’est 40% des personnes qui rencontres un dysfonctionnment sur leur smartphone et donc 57% qui n’en rencontrent pas. Les problèmes qui reviennent le plus sont le 10 (problème de batterie) avec 65 personnes, le 18 (stockage saturé) avec 62 personnes, et le 25 (problème de lenteur) avec 37 personnes. Comme nous le montre la matrice suivante, qui indique en ligne 1, le numéro du problème et en ligne 2, le nombre de femmes le rencontrant :

# Sélection d'une base avec condition la variable "SEXE" qui vaut 2
femmes <- data[(which(data$SEXE==2)),]

# Nombre de femmes dans la base rencontrant et ne rencontrant pas de dyfonctionnements avec leur smartphone
nb_femmes_avec_pbs <- nrow(femmes) - length(which(femmes$RIDENTIFICATION_PROBLEMES == "27")) # résultat : 208
nb_femmes_sans_pbs <- length(which(femmes$RIDENTIFICATION_PROBLEMES == "27")) # résultat : 314

# Poucentage de femmes dans la base rencontrant et ne rencontrant pas de dyfonctionnements avec leur smartphone
pourcent_nb_femmes_avec_pbs <- round(100*nb_femmes_avec_pbs/nrow(femmes),2) # résultat : 39.85 %
pourcent_nb_femmes_sans_pbs <- round(100*nb_femmes_sans_pbs/nrow(femmes),2) # résultat : 60.15 %

# Pbs rencontrés chez les femmes : (utilisation de la fonction Count_VCM)

variable=femmes$RIDENTIFICATION_PROBLEMES
nb_de_modalites=27
print(Count_VCM(variable,nb_de_modalites))
##      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14]
## [1,]    1    2    3    4    5    6    7    8    9    10    11    12    13    14
## [2,]   20   16   14    8    9   15   13    3   13    65    20     3     5    15
##      [,15] [,16] [,17] [,18] [,19] [,20] [,21] [,22] [,23] [,24] [,25] [,26]
## [1,]    15    16    17    18    19    20    21    22    23    24    25    26
## [2,]    13    11     2    62     8    16    12    12    24    31    37     2
##      [,27]
## [1,]    27
## [2,]   314

Le diagramme à bars suivant permet de visualiser les valeurs obtenues par les deux matrices ci-dessus et de faire une comparaison entre les genres :

Remarque : on observe que les 3 principaux problèmes rencontrés sont les mêmes dans les deux genres. En moyenne c’est deux types de dysfonctionnement rencontrés par les femmes sur leur smartphone et de même pour les hommes. Le genre du propriétaire ne semble donc avoir aucune incidence sur le nombre de dysfonctionnements rencontrés sur son smartphone.

3 ) Incidence de la tranche d’âge sur les dysfonctionnements

Le diagramme suivant représente les différents dysfonctionnements rencontrés et les couleurs différentes sur chaque barres représente une tranche d’âge différente :

On remarque que les 15-24 ans sont assez majoritaires dans les personnes rencontrant les 3 dysfonctionnements les plus fréquents, alors qu’ils ne sont pas ceux étant le plus présents dans la base de données, ils sont suivis des 30-49 ans et des 50-64 ans, eux étant trés présents dans la base de données. La tranche de d’âge a aussi trés peu d’inlfuence sur le nombre de dysfonctionnment que notre smartphone pourrait rencontrer, en effet par tranche d’âge on observe une moyenne d’un dysfonctionnement rencontré. Seul les +65 ans ont une moyenne de 0 dysfonctionnement rencontré (0.38).

4 ) Incidence de la propriété sur les dysfonctionnements

Rappel : Libelle modalité (Variable “ACQUISITIONTEL”)

  • 1 : Quelqu’un me l’a offert ou donné

  • 2 : Quelqu’un me l’a prêté

  • 3 : Je l’ai acheté

  • 4 : Je l’ai obtenu dans le cadre de mon contrat avec mon opérateur

  • 5 : Mon employeur me l’a fourni

  • 6 : Je l’ai loué

  • 7 : Je ne me souviens pas

  • 8 : Obtenu par un autre moyen

La matrice suivante donne en ligne 1 la façon dont le téléphone a été obtenu, et ligne 2 le nombre total de dysfonctionnement rescensé pour ce type d’acquisition :

##      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
## [1,]    1    2    3    4    5    6    7    8
## [2,]  157    3  595   63   10    4    0    0

On remarque qu’en terme de propriétés ceux qui ont acheté leur smartphone eux-mêmes sont ceux qui rencontrent le plus de dysfonctionnements avec 595 personnes dans ce cas,en deuxième position il y a ceux à qui on l’a offert ou donné, et en troisième position, ceux à qui ne l’ont pas obtenu dans le cadre de leur contrat avec leur opérateur. À contrario ceux l’ayant obtenu par un autre moyen et ceux ne se souvenant pas de la propriété ne rencontrent aucun dysfonctionnement. Le fait d’acheter un smartphone neuf semble donc avoir une influence sur le nombre de dysfonctionnement que l’on rencontrera par la suite.

5 ) Graphe présentant le nombre de dysfonctionnement moyen rencontrés en fonction du nombre d’années de possession du smartphone

La matrice suivante présente en ligne 1, l’année d’obtention du smartphone, et en ligne 2 le nombre moyen de dysfonctionnements rencontrés :

##      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14]
## [1,] 2000 2001 2002 2004 2005 2006 2008 2015 2016  2017  2018  2019  2020  2021
## [2,]    0    0    2    3    2    2    1    2    1     1     1     1     1     1
##      [,15] [,16]
## [1,]  2022  2023
## [2,]     1     1

On représente graphiquement ces valeurs avec le graphe suivant, qui donne en abscisse le nombre d’année de possession et en ordonnée le nombre de dysfonctionnement rencontrés :

On remarque qu’en effet plus le smartphone est vieux plus les dysfonctionnements sont élévés avec une moyenne de 3 dysfonctionnements pour un smartphone de 19 ans, et de 2 dysfonctionnements pour un smartphone de 8 ans.

VI ) Temps de cohabitation

1 ) Temps de cohabitation moyen

Rappel : Libelle modalités (Variable “COHABITATION_DYSFONCTIONNEMENT_A…”)

  • 1 : Dès que j’ai décelé le dysfonctionnement

  • 2 : Moins d’un mois

  • 3 : Entre 1 et 6 mois

  • 4 : Entre 6 mois et 2 ans

  • 5 : Plus de deux ans

  • 6 : Je ne sais pas

La matrice suivante présente en ligne 1 les différents types de dysfonctionnements, et en ligne 2 une modalité moyenne, du temps de cohabitation, pour chaque type de dysfonctionnement :

##      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14]
## [1,]    1    2    3    4    5    6    7    8    9    10    11    12    13    14
## [2,]    3    2    3    3    1    2    2    2    2     2     2     3     2     2
##      [,15] [,16] [,17] [,18] [,19] [,20] [,21] [,22] [,23] [,24] [,25]
## [1,]    15    16    17    18    19    20    21    22    23    24    25
## [2,]     2     2     0     2     2     2     2     3     1     2     2

Le graphe suivant permet de visualiser cette matrice, la ligne rouge représente le temps moyen de cohabitation parmis tous les dysfonctionnements :

On remarque que le temps de cohabitation moyen est de 2, c’est-à-dire qu’en moyenne les propriétaires cohabitent avec le problème moins d’un mois avant de le régler ou de changer de téléphone. Pour les dysfonctionnements 1 (Problème avec l’écran), 3 (Problème avec l’appareil photo), 4 (Problème avec la lampe torche ou le flash), 12 (Problème de capteurs), 22 (Fonctionnalité qui ne marche plus), le temps de cohabitation moyen est de 3 (entre 1 et 6 mois). Les dysfonctionnements 5 (Problème avec le GPS) et 23 (Dysfonctionnement logiciel) se réglent en moyenne trés vite, dès que le dysfonctionnement est décelé.

2 ) Temps de cohabitation moyen en fonction du genre

Grâce à ce graphe, on va pouvoir observer si le genre a une influence sur le temps de cohabitation avec le dysfonctionnement :

Le temps de cohabitation moyen entre les femmes et les hommes est le même et il vaut 2, ce qui signifie que les femmes comme les hommes cohabitent avec le problème moins d’un mois. Il y a quand même des disparités en terme de temps moyen de cohabitation, entre les genres en fonction des types de dysfonctionnements. Pa rexemple les femmes vont cohabité plus longtemps avec un problème de batterie que les hommes. A contrario les hommes vont mettre plus de temps à cohabiter avec une fonctionnalité qui ne marche plus que les femmes.

3 ) Temps de cohabitation moyen en fonction de la CSP

Grâce à ce graphe, on va pouvoir observer si la CSP (catégorie socio-professionelle) a une influence sur le temps de cohabitation avec le dysfonctionnement :

Rappel : Libelle modalités (Variable “CSP5”)

  • 1 : CSP+ (comprend les artisans, les cadres et les professions intermédiaires (Professions intermédiaires de la santé et du social, d’entreprise…))

  • 2 : CSP- (comprend les agriculteurs, les employés et les ouvriers)

  • 3 : Retraités

  • 4 : Etudiants

  • 5 : Autres Inactifs

La matrice ci-dessous nous donne en ligne 1 le numéro de la CSP, et en ligne 2 le temps moyen de cohabitation tout problème confondu pour la CSP en question :

##      [,1] [,2] [,3] [,4] [,5]
## [1,]    1    2    3    4    5
## [2,]    2    2    2    2    1

On remarque les propriétaires “inactifs” en moyenne réglent le problème assez vite, dés qu’il est décelé. En ce qui concerne les autres CSP, les propriétaires rèlent le problème en moins d’un mois en moyenne.

VII ) Types de gênes

Rappel : Libellé modalité (Variables “GENE_PROBLEMES_A…”) :

Degrés de gêne :

  • 1 : Très gênant

  • 2 : Plutôt gênant

  • 3 : Plutôt pas gênant

  • 4 : Pas gênant du tout

1 ) Quels pbs sont plus ou moins faciles à vivre ? (niveau de gènes moyen pour chaques pbs)

La matrice suivante donne le niveau de gênes moyen pour chaques dysfonctionnements :

##      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14]
## [1,]    1    2    3    4    5    6    7    8    9    10    11    12    13    14
## [2,]    2    2    2    2    2    2    2    2    1     2     2     2     2     2
##      [,15] [,16] [,17] [,18] [,19] [,20] [,21] [,22] [,23] [,24] [,25]
## [1,]    15    16    17    18    19    20    21    22    23    24    25
## [2,]     2     2     3     2     2     2     2     2     2     2     2

On remarque qu’en moyenne les dysfonctionnements sont concidérés comme étant “plutôt génant”. Le 9 (problème de chargement) est le seul étant concidéré comme étant “trés gênant”. Le 17 (Problème de vibreur) lui est le seul étant concidéré en moyenne comme étant “plutôt pas gênant”

2 ) Matrice entre les problèmes et les types de gênes

La matrice suivante donne en ligne 1 les types de dysfonctionnements et les lignes qui suivent correspondent pour chaque dysfonctionnement au nombre de propriétaire de smartphone qui ont ressentis chaque degrés de gênes. Exemple : pour le dysfonctionnement 1 (Problème avec l’écran), 1 personne l’a ressentis comme étant “très gênant”, 11 personnes comme “plutôt gênant”, 16 personnes comme “plûtot pas gênant” et 2 personnes comme étant “facile à vivre”pas gêant du tout”.

##      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14]
## [1,]    1    2    3    4    5    6    7    8    9    10    11    12    13    14
## [2,]   11    4   11    2    5    4    8    5   20    43    10     1     2    10
## [3,]   11   19    6    5    4   12   16    5   11    53    26     4     9     7
## [4,]   16   10    3    2    2    8    2    2    2    17     5     1     1     7
## [5,]    2    1    4    1    1    2    0    0    0     1     0     1     0     1
##      [,15] [,16] [,17] [,18] [,19] [,20] [,21] [,22] [,23] [,24] [,25]
## [1,]    15    16    17    18    19    20    21    22    23    24    25
## [2,]    13     3     0    36     6    13     3     7    11     9    27
## [3,]     9    11     2    46     6    10    12     9    22    33    42
## [4,]     2     3     2    10     5     8     9     2     3    12    14
## [5,]     0     1     1     0     2     1     3     1     0     0     0

On remarque que les pbs qui reviennent le plus souvent (le 10, le 18 et le 25), sont ressentis comme étant “plutôt génant”, par les personnes qui y sont confrontés. Des pbs comme le 9 et le 15 eux sont ressentis comme étant “trés génant” majoritairement.

VIII ) Réparation

1 ) Raisons de ne pas réparer

Rappel : Libellé modalités (Variable “RRAISON_UTIL_PB”)

  • 1 : Cela serait trop coûteux de résoudre le(s) problème(s) ou de remplacer mon smartphone

  • 2 : J’attends une opportunité

  • 3 : Je ne peux pas résoudre le problème car le smartphone ne m’appartient pas

  • 4 : Je ne sais pas comment résoudre le(s) problème(s)

  • 5 : Je veux faire durer mon téléphone le plus longtemps possible

  • 6 : Ce(s) problème(s) ne m’impacte(nt) pas tant que ça au quotidien

  • 7 : Je n’ai pas pris le temps de m’en occuper, de chercher une solution

  • 8 : Mon téléphone est trop récent pour que je le fasse réparer ou que je le remplace

  • 9 : La résolution du (ou des) problème(s) est trop difficile ou incertaine

  • 10 : Ça me donne un prétexte pour moins l’utiliser

  • 11 : Cela ne vaut pas la peine de résoudre le(s) problème(s)

  • 12 : Mon smartphone a une particularité difficile à retrouver si je devais le remplacer

  • 13 : Autre

La matrice suivante donne le nombre de personnes ayant choisi chaque modalités pour la variable indiquant les comportements face aux dysfonctionnements :

# Raisons de ne pas réparer

res <- Count_VCM(data$RRAISON_UTIL_PB_FORM,13)
print(res)
##      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13]
## [1,]    1    2    3    4    5    6    7    8    9    10    11    12    13
## [2,]   55   31    3   16   85   65   35   26    8     4    32     5     5

On voit que la raison principale de ne pas réparer est le fait de vouloir faire durer le téléphone le plus longtemps possible, en deuxième position on a le fait que ce(s) problème(s) n’impacte(nt) pas tant que ça au quotidien, et en troisième position, on a le fait que cela serait trop coûteux de résoudre le(s) problème(s) ou de remplacer le smartphone.

2 ) Raisons de ne pas réparer en fonction du genre

3 ) Intention de réparation

Rappel : Libellé modalités (Variable “INT_REPARATION_A…”)

  • 1 : Oui, par moi-même

  • 2 : Oui, par le SAV ou un réparateur

  • 3 : Oui, par une connaissance

  • 4 : Pas pour l’instant

  • 5 : Non

1 ) Intention de réparation en fonction du genre
## [1] "Intention de réparation moyenne chez les femmes : "
##      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14]
## [1,]    1    2    3    4    5    6    7    8    9    10    11    12    13    14
## [2,]    4    3    3    4    4    2    4    0    3     4     4     4     4     5
##      [,15] [,16] [,17] [,18] [,19] [,20] [,21] [,22] [,23] [,24] [,25]
## [1,]    15    16    17    18    19    20    21    22    23    24    25
## [2,]     4     3     0     3     4     4     4     5     4     3     4
## [1] "En général les femmes mettent la raison  4 comme intention de réparation."
## [1] "Intention de réparation moyenne chez les hommes : "
##      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14]
## [1,]    1    2    3    4    5    6    7    8    9    10    11    12    13    14
## [2,]    4    3    3    0    4    5    3    5    4     4     3     4     4     3
##      [,15] [,16] [,17] [,18] [,19] [,20] [,21] [,22] [,23] [,24] [,25]
## [1,]    15    16    17    18    19    20    21    22    23    24    25
## [2,]     3     2     4     3     4     4     5     0     2     3     3
## [1] "En général les hommes mettent la raison  4 comme intention de réparation."
2 ) Intention de réparation en fonction de la CSP

Rappel : Libelle modalités (Variable “CSP5”)

  • 1 : CSP+ (comprend les artisans, les cadres et les professions intermédiaires (Professions intermédiaires de la santé et du social, d’entreprise…))

  • 2 : CSP- (comprend les agriculteurs, les employés et les ouvriers)

  • 3 : Retraités

  • 4 : Etudiants

  • 5 : Autres Inactifs

##               CSP categorie Moyenne
## 1            CSP+         1       3
## 2            CSP-         2       3
## 3       Retraités         3       3
## 4       Étudiants         4       4
## 5 Autres Inactifs         5       4